高情商AI Agent来了!剑桥团队推出进化RL框架EvoEmo,靠愤怒、悲伤成功“讨价还价”
在日常生活中,谈判无处不在:网购时“卖家再降 50”就下单,租房时跟房东争取“押一付一”,在职场上和客户敲定合作细节…… 这时候,“情感技巧”往往是关键,比如假装犹豫说“预算真的不够了”,或是适度表达期待,总能让谈判朝着对自身更有利的方向发展。
在日常生活中,谈判无处不在:网购时“卖家再降 50”就下单,租房时跟房东争取“押一付一”,在职场上和客户敲定合作细节…… 这时候,“情感技巧”往往是关键,比如假装犹豫说“预算真的不够了”,或是适度表达期待,总能让谈判朝着对自身更有利的方向发展。
过去几年,大语言模型(LLM)的训练大多依赖于基于人类或数据偏好的强化学习(Preference-based Reinforcement Fine-tuning, PBRFT):输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3
机器人操控一直是机器人技术领域的核心挑战。从工厂中的机械臂到家庭服务机器人,如何让机器人灵活、精细且智能地完成各种操作任务,是研究者们数十年来努力的方向。传统的操控方法往往需要工程师精心设计控制规则,或者让机器人反复观看人类演示进行模仿学习。但这些方法通常缺乏
在过去二十年,硅谷的互联网是属于印度人的。他们以勤奋、高效和强大的执行力,撑起了硅谷互联网时代的软件帝国。但随着生成式AI的崛起,硅谷的人才格局正在发生系统性倾斜。华人,正在成为AGI赛道里最重要的人才来源,没有之一。看看硅谷的“含华量”有多高:Meta超级智